Knowledge tracing (KT) aims to leverage students' learning histories to estimate their mastery levels on a set of pre-defined skills, based on which the corresponding future performance can be accurately predicted. In practice, a student's learning history comprises answers to sets of massed questions, each known as a session, rather than merely being a sequence of independent answers. Theoretically, within and across these sessions, students' learning dynamics can be very different. Therefore, how to effectively model the dynamics of students' knowledge states within and across the sessions is crucial for handling the KT problem. Most existing KT models treat student's learning records as a single continuing sequence, without capturing the sessional shift of students' knowledge state. To address the above issue, we propose a novel hierarchical transformer model, named HiTSKT, comprises an interaction(-level) encoder to capture the knowledge a student acquires within a session, and a session(-level) encoder to summarise acquired knowledge across the past sessions. To predict an interaction in the current session, a knowledge retriever integrates the summarised past-session knowledge with the previous interactions' information into proper knowledge representations. These representations are then used to compute the student's current knowledge state. Additionally, to model the student's long-term forgetting behaviour across the sessions, a power-law-decay attention mechanism is designed and deployed in the session encoder, allowing it to emphasize more on the recent sessions. Extensive experiments on three public datasets demonstrate that HiTSKT achieves new state-of-the-art performance on all the datasets compared with six state-of-the-art KT models.
translated by 谷歌翻译
While natural systems often present collective intelligence that allows them to self-organize and adapt to changes, the equivalent is missing in most artificial systems. We explore the possibility of such a system in the context of cooperative object manipulation using mobile robots. Although conventional works demonstrate potential solutions for the problem in restricted settings, they have computational and learning difficulties. More importantly, these systems do not possess the ability to adapt when facing environmental changes. In this work, we show that by distilling a planner derived from a gradient-based soft-body physics simulator into an attention-based neural network, our multi-robot manipulation system can achieve better performance than baselines. In addition, our system also generalizes to unseen configurations during training and is able to adapt toward task completions when external turbulence and environmental changes are applied.
translated by 谷歌翻译
Artificial intelligence is currently powering diverse real-world applications. These applications have shown promising performance, but raise complicated ethical issues, i.e. how to embed ethics to make AI applications behave morally. One way toward moral AI systems is by imitating human prosocial behavior and encouraging some form of good behavior in systems. However, learning such normative ethics (especially from images) is challenging mainly due to a lack of data and labeling complexity. Here, we propose a model that predicts visual commonsense immorality in a zero-shot manner. We train our model with an ETHICS dataset (a pair of text and morality annotation) via a CLIP-based image-text joint embedding. In a testing phase, the immorality of an unseen image is predicted. We evaluate our model with existing moral/immoral image datasets and show fair prediction performance consistent with human intuitions. Further, we create a visual commonsense immorality benchmark with more general and extensive immoral visual contents. Codes and dataset are available at https://github.com/ku-vai/Zero-shot-Visual-Commonsense-Immorality-Prediction. Note that this paper might contain images and descriptions that are offensive in nature.
translated by 谷歌翻译
医学图像中的血管分割是诊断血管疾病和治疗计划的重要任务之一。尽管已经对基于学习的细分方法进行了广泛的研究,但在有监督的方法中需要大量的基础真实标签,并且令人困惑的背景结构使神经网络难以以无监督的方式分割血管。为了解决这个问题,在这里,我们介绍了一种新型的扩散对抗表示学习(DARL)模型,该模型利用具有对抗性学习的降解扩散概率模型,并将其应用于血管分割。特别是,对于自我监管的血管分割,Darl使用扩散模块学习背景图像分布,该模块使生成模块有效地提供了容器表示。同样,通过基于提议的可切换在空间自适应的否定规范化的对抗学习,我们的模型估计了合成的假船只图像以及船舶分割掩码,这进一步使模型捕获了辅助血管的语义信息。一旦训练了提出的模型,该模型就会生成一个步骤,并可以应用于冠状动脉血管造影和视网膜图像的一般血管结构分割。各种数据集的实验结果表明,我们的方法在船舶分割中的现有无监督和自我监督方法的表现显着胜过。
translated by 谷歌翻译
知识跟踪(KT)是一个研究领域,可以根据从智能辅导系统,学习管理系统和在线课程等教育应用程序中收集的先前绩效数据集来预测学生的未来表现。以前关于KT的研究仅集中在模型的解释性上,而其他研究则集中在增强性能上。考虑可解释性和提高性能的模型不足。此外,与现有模型相比,专注于绩效改进的模型尚未显示出压倒性的性能。在这项研究中,我们提出了Monacobert,该研究在大多数基准数据集上实现了最佳性能,并且具有明显的解释性。 Monacobert使用基于BERT的架构具有单调卷积多头注意,这反映了学生的遗忘行为并增加了模型的表示能力。我们还可以使用基于经典的测试理论(基于CTT)的嵌入策略来提高性能和解释性,该策略考虑了问题的难度。为了确定莫纳科伯特(Monacobert)为何达到最佳性能并定量解释结果,我们使用Grad-CAM,UMAP和各种可视化技术进行了消融研究和其他分析。分析结果表明,两个注意力组成部分相互补充,基于CTT的嵌入代表了有关全球和局部困难的信息。我们还证明了我们的模型代表概念之间的关系。
translated by 谷歌翻译
强化学习者必须推广其培训经验。先前的工作主要集中在相同的培训和评估环境上。从最近引入的Crafter Benchmark(一个2D开放世界生存游戏)开始,我们引入了一套新的环境,适合评估某些代理商对以前看不见的(数量)对象的概括并快速适应(元学习)的能力。在Crafter中,通过培训1M步骤时,通过未锁定成就(例如收集资源)来评估代理商。我们表明,当前的代理商努力概括,并引入新颖的以对象为中心的代理,从而改善了强大的基准。我们还通过多个实验为未来在手工艺品上的工作提供了一般兴趣的关键见解。我们表明,仔细的超参数调整可以通过大幅度提高PPO基线代理,即使是前馈代理也可以通过依靠库存显示来解锁所有成就。我们在原始的手工环境中实现了新的最新性能。此外,当经过100万步的​​培训时,我们的调整代理几乎可以解锁所有成就。我们表明,即使删除了库存信息,复发性PPO代理也比进发料剂改进了。我们介绍Crafterood,这是一组15个新的环境,可以评估OOD概括。在Crafterood上,我们表明目前的代理无法概括,而我们的新颖中心的代理人实现了最新的OOD概括,同时也可以解释。我们的代码是公开的。
translated by 谷歌翻译
现有的多模式应力/疼痛识别方法通常独立地从不同模态中提取特征,因此忽略了交叉模式相关性。本文提出了一个新的几何框架,用于利用对称阳性定位(SPD)矩阵作为一种表示形式的多模式应力/疼痛检测,该代表结合了协方差和交叉稳定性的生理和行为信号的相关关系。考虑到SPD矩阵的Riemannian流形的非线性,众所周知的机器学习技术不适合对这些矩阵进行分类。因此,采用切线空间映射方法将派生的SPD矩阵序列映射到可将基于LSTM的网络用于分类的切线空间中的向量序列。提出的框架已在两个公共多模式数据集上进行了评估,这两者都取得了压力和疼痛检测任务的最新结果。
translated by 谷歌翻译
最近的几种少数学习算法中的大多数都是基于转移学习,其中模型是使用大量源数据进行预训练的,并且随后使用少量目标数据更新了预训练的模型。在基于转移的几次学习中,已经广泛研究了复杂的预训练方法,以进行通用和改进的表示。但是,几乎没有关于更新预训练模型以进行几次学习的研究。在本文中,我们比较了两种流行的更新方法,即微调(即更新整个网络)和线性探测(即仅更新线性分类器),考虑了源数据和目标数据之间的分布变化。我们发现,随着样品数量的增加,无论分布变化如何,微型调整都比线性探测更好。接下来,我们研究了对预训练模型进行微调时,数据增强的有效性和无效性。我们的基本分析表明,需要仔细考虑有关更新预训练模型的详细信息,才能获得更好的射击性能。
translated by 谷歌翻译
胃内窥镜筛查是在早期决定适当的胃癌(GC)治疗的有效方法,从而降低了与GC相关的死亡率。尽管人工智能(AI)带来了一个巨大的希望,可以帮助病理学家筛选数字化整个幻灯片图像,但现有的AI系统受到细粒癌症亚赛的限制,在计划癌症治疗方面几乎没有可用性。我们提出了一个实用的AI系统,该系统可以实现五个GC病理的亚分类,可以直接与一般的GC治疗指南相匹配。 AI系统旨在通过模仿人类病理学家理解组织学的方式,通过使用2阶段混合视觉变压器(VIT)网络通过多尺度的自我注意力转换器(VIT)网络通过多尺度的自我发项机制来有效区分多级GC。 AI系统通过在多中心队列中达到1,212张幻灯片,通过达到高于0.85的类平均灵敏度来显示可靠的诊断性能。此外,与人类病理学家相比,AI辅助病理学家显示出12%的诊断敏感性显着提高了12%。我们的结果表明,在实际临床环境中,AI辅助胃内窥镜筛查具有提供假定的病理学意见和适当的胃癌癌症治疗的巨大潜力。
translated by 谷歌翻译
BlenderBot 2.0是通过使用Internet搜索模块和多次会话来反映实时信息和记住用户信息来表示开放式聊天聊天的对话模型。尽管如此,模型仍然有改进的空间。为此,我们从三个角度检查了BlenderBot 2.0限制和错误:模型,数据和用户。从数据的角度来看,我们突出了在众包流程期间向工人提供的不明确指南,以及缺乏在收集的数据中炼制仇恨言论的过程,并验证基于互联网的信息的准确性。从用户的角度来看,我们确定了百分之九种类型的展示2.0问题,并彻底调查了它们的原因。此外,对于每个观点来说,提出了实际改进方法,我们讨论了几个潜在的未来研究方向。
translated by 谷歌翻译